Rank in Wordlist | Frequency | Word |
---|---|---|
3208 | 57 | 한-미 |
6269 | 31 | 원-달러 |
6825 | 28 | 3-0으로 |
7092 | 27 | 0-1로 |
7972 | 24 | 2-1로 |
8351 | 23 | 2-0으로 |
8739 | 22 | 1-0으로 |
8745 | 22 | 3-1로 |
10117 | 19 | 0-0으로 |
10153 | 19 | K-1 |
10693 | 18 | 1-1로 |
11329 | 17 | 2008-2009 |
11336 | 17 | 3-2로 |
12843 | 15 | 2-2로 |
12852 | 15 | 3-0 |
12856 | 15 | 4-1로 |
14748 | 13 | 1-2로 |
14763 | 13 | 2-3으로 |
14766 | 13 | 2007-2008 |
14815 | 13 | K-리그 |
Rank in Wordlist | Frequency | Word |
---|---|---|
26032 | 7 | 4-4-2 |
41706 | 4 | 4-3-3 |
56998 | 3 | 당-정-청 |
71828 | 2 | 2-0(21-13 |
71908 | 2 | 2008-10-13 |
71909 | 2 | 2008-10-26 |
112578 | 2 | 한-미-일 |
115248 | 1 | -PGA- |
115664 | 1 | 000-0000-0000 |
115700 | 1 | 02-2001-1547 |
Rank in Wordlist | Frequency | Word |
---|---|---|
131484 | 1 | 3억-14억-94억원이하-94억원초과 |
132006 | 1 | 4-1-4-1 |
146394 | 1 | am-is-are-was-were’로 |
152830 | 1 | 강릉·태백-영월-평창-정선 |
164165 | 1 | 공기업)-종합건설업체(대형건설업체-원도급)-전문공사업체(전문건설업체-하도급)로 |
180447 | 1 | 김주성-표명일-이광재-강대협-레지 |
191533 | 1 | 단식-단식-복식-단식-단식 |
198185 | 1 | 도쿄-항저우-서울-홍콩-타이베이-교토를 |
220738 | 1 | 박명환-옥스프링-브라운-봉중근-심수창 |
222633 | 1 | 발-손-다리-등-배의 |
Rank in Wordlist | Frequency | Word |
---|---|---|
146394 | 1 | am-is-are-was-were’로 |
164165 | 1 | 공기업)-종합건설업체(대형건설업체-원도급)-전문공사업체(전문건설업체-하도급)로 |
180447 | 1 | 김주성-표명일-이광재-강대협-레지 |
191533 | 1 | 단식-단식-복식-단식-단식 |
198185 | 1 | 도쿄-항저우-서울-홍콩-타이베이-교토를 |
220738 | 1 | 박명환-옥스프링-브라운-봉중근-심수창 |
222633 | 1 | 발-손-다리-등-배의 |
298373 | 1 | 이종범-유지현-김민호-류중일-박진만-김민재 |
316154 | 1 | 정재훈-임태훈-김상현-이승학-이용찬 |
356509 | 1 | 프랑스-벨기에-네덜란드-독일-룩셈부르크를 |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters